vlm

自动驾驶中常提的VLM是个啥?与VLA有什么区别?

自动驾驶车辆要在复杂多变的道路环境中安全行驶,不仅需要“看见”前方的车辆、行人和路面标志,还需要“读懂”交通标识上的文字提示、施工告示牌和乘客的语言指令。之前和大家讨论过VLA(相关阅读:自动驾驶中常提的VLA是个啥?),了解到视觉-语言-动作模型,但在很多场

模态 transformer vla 自然语言 vlm 2025-09-24 04:46  5